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基于 HRV 分 析 的 可 穿戴 心 电 仪 精神 疲劳 检测 
黄 诗 童 ， 张 威 强 ， 张 朋 柱 


(上 海 交 通 大 学 安泰 经 济 与 管理 学 院 ， 上 海 200030) 


摘 SE: 精神 疲劳 是 许多 慢性 疾病 如 心血 管 疾 病 、 糖 尿 病 和 癌症 的 关键 原因 ， 然 而 又 难以 量化 评估 及 测量 ， 提 出 了 一 
种 通过 智能 穿戴 设备 检测 脑力 劳动 者 疲劳 程度 的 工程 可 行 性 的 方案 。 为 了 检测 脑力 疲劳 程度 ， 通 过 Man-Whitney U 检 
验 评估 了 HRV 各 项 指标 在 判断 精神 疲劳 状态 的 统计 显著 性 ， 并 使 用 随机 森林 进行 特征 选择 以 确定 HRV 各 项 指标 的 重 
要 性 ; 研究 发 现 ， 最 重要 的 HRV 指标 分 别 是 NN。mean，PNN50、VLF、LF 和 TP。 最 后 采用 SVM, Naïve Bayes, 
KNN 和 这 辑 回 归 四 种 机 器 学 习 算 法 对 进行 疲劳 状态 进行 识别 ， 实 验证 明了 KNN 分 类 器 最 为 有 效 ， 其 交叉 验证 准确 率 
为 75.5% 和 AUC 为 0.74。 
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Detection of mental fatigue with wearable ECG devices based on HRV analysis 


Shitong Huang, Weiqiang Zhang, Pengzhu Zhang 
(Antai College of Economics & Management, Shanghai Jiao Tong University, Shanghai 200030, China) 


Abstract: Mental fatigue is a key cause of many chronic diseases such as CVD, diabetes and cancer. It is illusive and hard to 
measure or detect. This research proposes a feasible accurate and cost saving method to detect fatigue level of mental workers 
via smart wearable devices. In order to detect mental fatigue level, this paper firstly extracted HRV features, then used Man- 
Whitney U Test to evaluate the statistical significances of HRV features between Normal and Fatigue state. This paper used 
Random Forest for feature selection to determine the importance of HRV features. The most important HRV features are NN. 
mean, PNN50, VLF, LF and TP respectively. This paper then took four machine learning algorithms on selected features to 
predict the state of mental fatigue. The experiments demonstrated the effectiveness of KNN classifier with 75.596 accuracy rate 


on cross validation and 0.74 AUC. 
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损害 之 外 ， 精 神 疲 劳 还 对 记忆 力 ， 判 断 力 ， 决 策 能 力 和 情绪 管 
理 有 着 诸多 影响 站， 长 期 的 超额 工作 会 导致 压力 和 紧张 ， 并 进 
精神 疲劳 是 人 体 疫 倦 的 主观 感受 ， 大 多 数 精 神 } I 定义 步 导 致 更 高 的 事故 发 生 率 和 有 旷工 率 以 及 更 低 的 生产 效率 71。 

在 脑力 功能 表现 方面 (“1。Grandjean 将 精神 疲劳 描述 前 全 球 超过 四 分 之 一 的 脑力 工作 者 具有 面临 过 度 劳累 的 


x 


d 
进 
到 


为 一 种 损害 大 脑 机 能 的 低 警 觉 状 态 趾 .Staals 将 精神 疲劳 描述 为 ” 风险 。 过 度 劳 累 导 致 的 精神 疲劳 会 引起 睡眠 质量 降低 、 压 力 和 
种 由 于 细胞 容量 不 足 而 无 法 保持 原 有 的 警觉 性 的 中 枢 神 经 系 ”” 焦虑 等 一 系列 症状 ， 并 间接 导致 心 脑 血 管 疾病 、 糖 尿 病 和 癌症 
统 状 态 启 。 在 本 文 的 定义 中 ， 精 神 疲 劳 是 指 由 认 知 活动 时 间 过 ”等 一 系列 慢 病 疾病 风险 。 因 此 使 用 智能 可 穿戴 设备 ， 利 用 生 开 
久 而 导致 的 大 脑 最 大 认 知 能 力 暂 时 性 降低 状态 ， 外 在 表现 为 嗜 ” 指标 来 检测 脑力 工作 者 的 疲劳 程度 并 防止 疲劳 程度 进一步 恶化 
睡 、 昏 睡 或 注意 力 减 弱 。 国 内 外 医学 理论 研究 表明 ， 过 度 疲 劳 “是 非常 有 意义 
已 经 成 为 突 发 性 致命 疾病 的 主要 原因 ， 并 且 有 研究 表明 ， 中 风 尽管 研究 精神 疲劳 对 于 脑力 工作 者 的 身心 健康 具有 重要 意 
与 过 劳 死 都 与 过 度 工作 导致 的 精神 疲 芝 有 很 强 的 关系 内 ， 高 强 。 义 ， 然 而 精神 疲劳 在 实际 生活 中 难以 度量 。 现 目前 ， 国 内 外 精 
度 的 工作 会 增加 心血 管 疾病 的 发 生 概率 中 。 除 了 对 生理 健康 的 ，” 神 疲 劳 量化 方法 主要 分 为 四 大 类 : 主观 量 表 法 、 客 观 实验 法 、 
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观察 法 和 生理 指标 测量 法 。 主 观 量 表 法 要 求 被 试 通过 问卷 调查 
来 评估 他 们 的 精神 疲劳 程度 ， 相 关 的 量 表 如 斯 坦 福 嗜睡 量 表 
(SSS),， 查 尔 德 疲劳 量 表 (CFS) 和 疲劳 严重 程度 量 表 (FSS) 
等 。 主 观 量 表 法 虽然 简单 高 效 ， 但 由 于 受众 自身 的 医学 水 平 参 
差 不 齐 ， 导 致 主观 量 表 的 客观 准确 度 相 对 较 低 ， 但 可 以 作为 后 
续 方法 的 参照 。 客 观 实验 量化 方法 设计 一 些 意 识 任务 来 评估 被 
测试 者 的 大 脑 机 能 表现 。 有 些 任 务 测量 被 测试 者 的 反应 时 间 、 
记忆 力 和 决策 力 ， 如 异常 警觉 的 任务 PVT) UI, 多 重 睡眠 潜伏 
期 试验 (MSLT) 和 清醒 维持 试验 (MWT) PI, JUEGA EP HIT 
精神 疲劳 量化 ， 通 过 观察 被 试 困 倦 的 状态 ， 如 甩 眼 ， 打 哈欠 等 
生理 状态 反映 出 被 试 的 疲劳 状态 。 

以 上 三 项 措施 都 具有 侵扰 性 ， 因 为 用 户 必 须 停 止 目前 的 工 
作 来 完成 问卷 或 意识 任务 。 因 此 ， 这 些 方 法 不 能 用 来 监测 日 常 
生活 中 的 精神 疲劳 。 生 理 指标 测量 法 可 以 在 兼顾 日 常 工作 的 同 
时 检测 人 体 的 疲劳 状态 。 近 年 ， 国 内 外 学 者 对 生理 指标 检测 疲 
劳 进 行 了 许多 的 研究 。 脑 电 图 仪 CEEGO 广泛 用 于 测量 疲劳 驾 
驶 。 一 个 澳大利亚 研究 团队 开发 了 基于 EEG 的 驾驶 员 抗 疲劳 系 
统 来 监测 驾驶 员 的 精神 疲劳 0% 0， 利 用 ANOVA 分 析 ， 发 现 不 
同 频段 波谱 : delta ( 0 ) (+0-4Hz), theta ( 0 ) (4~8 Hz), alpha 
Ca ) (8-13 Hz). 在 疲劳 和 警觉 状态 存在 显著 差异 。 针 对 EEG 
与 疲劳 关系 的 研究 ， 张 露 等 人 在 双 耳 差 频 声 刺 激 下 检测 B SCRI 


王 钧 基于 主观 疲劳 量 表 与 HRV 相 结合 对 运动 性 疲劳 进行 检测 ， 


研究 发 现 , 在 连续 多 次 运动 疲劳 后 , NN.mean. SDNN.RMSSD, 


PNN50 值 降低 ，HRYV 与 血液 生化 指标 
HRV 被 证 明 可 用 用 作 检 测 视觉 疲劳 、 运 动 疲劳 ， 然 而 视觉 疲劳 


有 较 好 的 相关 性 [91。 


和 运动 疲劳 可 以 从 表象 特征 观察 到 ， 而 复杂 脑力 劳动 产生 的 精 
神 疲劳 却 鲜 少 能 被 直接 观察 并 测量 。 


本 文 的 研究 主要 探索 如 何 用 便携 式 心 电 仪 设备 检测 精神 疲 


劳 。 无 可 避免 的 是 ， 单 导 联 的 便携 式 心 


仪器 相 比 ， 采 集 信 号 的 准 


E 确 度 会 有 所 降 


在 于 基于 便携 式 心 电 仪 ， 


有 仪 设备 与 传统 多 导 联 


提出 一 种 工程 可 行 性 方案 ， 探 索 便携 


氏 ， 而 本 文 的 研究 目的 


心 电 设备 辅助 疲劳 检测 进行 健康 管理 的 可 行 性 而 非 为 医学 诊断 


提供 依据 。 针 对 该 研究 问题 ， 本 文 设计 和 进行 了 一 项 实验 来 测 


试 可 穿戴 心 电 仪 测量 精 
1 ”实证 与 分 析 方 法 
14 数据 准备 

本 次 采用 设备 为 朗 
“LaPatch”， 其 采 


inr 


疲劳 的 可 行 性 。 


朗科 技 公司 而 


E ECG 信号 的 芯片 为 德州 仪器 研发 的 
ADS1292R 芯片 ， 通 过 蓝牙 技术 将 数据 传 至 移动 终端 。35 名 无 


发 的 可 穿戴 式 心 电 仪 


心脏 病史 的 健康 大 学 生 参 与 实验 ， 其 中 男女 比例 1:1.3, 年 龄 段 
分 布 在 23 土 4 岁 , 在 实验 过 程 中 ,被 斌 被 要 求 佩戴 一 个 “LaPatch” 


(a 0y B ,发现 其 在 提高 注意 力 和 警觉 度 、 对 抗 脑力 疲劳 方面 
具有 应 用 前 景 [ 当 。 周 佳 苹 等 通过 观看 娱乐 节目 实验 测试 发 现 ， 
(a+9)/B、8B/a 在 疲劳 和 正常 状态 下 具有 显著 差异 [站 。 近 
年 , 机 器 学 习 算 法 也 被 广泛 应 用 于 疲劳 驾驶 研究 中 , Hu 等 人 从 
EEG 信号 中 提取 出 40 个 频谱 特征 ,用 SVM 模型 进行 训练 ， 达 
到 86% 的 疲劳 驾驶 识别 准确 率 [!I9。Hu 等 人 基于 梯度 提升 决策 
树 模 型 (GBDT) 将 EEG 信号 识别 驾驶 疲劳 的 准确 度 提升 至 94% 
(22 个 实验 样本 ) 053。 然 而 ， 基 于 脑 电 的 疲劳 检测 所 使 用 的 装 
置 通常 具有 多 个 通道 和 电极 ， 这 并 不 适合 在 日 常生 活 中 使 用 ， 
特别 是 在 办 公 室 或 家 居 场 景 。 因 此 非常 需要 一 种 随时 监测 心理 
精神 疲劳 的 便携 式 可 穿戴 设备 。 
随 着 最 新 的 卫生 信息 技术 发 展 和 智能 手 环 等 智能 可 穿戴 设 
备 的 普及 ， 实 时 和 远程 的 健康 监测 和 管理 成 为 可 能 。 近 年 来 出 
现 了 许多 用 于 连续 获取 生理 参数 的 智能 传感器 ， 例 如 带 有 蓝牙 
无 线 传输 功能 的 便携 式 心 电 仪 , 心率 和 血压 传感器 。 其 中 , ECG 
(心电图 机 〉 是 一 种 有 前 景 的 实时 精神 疲劳 监测 设备 。 相 比 于 


心 电 仪 设备 ， 可 以 实时 采集 被 试 的 ECG 信号 。 在 实验 开始 前 ， 
alder 疲劳 量 表 中 以 表征 其 当前 的 疲 
劳 程度 ， 在 实验 工程 中 ， 被 试 被 要 求 完 成 一 套 测评 ， 其 中 包括 
30 道 逻 辑 推理 题 ，25 道 记忆 题 ， 总 共 持 续 时 间 54+8min， 在 测 


被 试 被 要 求 填写 14 项 Ch 


试 结束 后 ,被 试 被 要 求 再 


次 按照 自 


身 的 真实 感受 再 次 填写 14 项 
Chalder 疲劳 量 表 ， 根 据 文献 Co 中 的 3/4 的 最 佳 阔 值 ， 本 次 试 
将 问卷 量 表 得 分 超过 50 分 的 标记 为 “疲劳 ”(fatigue = 1)， 将 


> 


iE 


小 于 50 分 的 标记 为 “正常 ”(fatigue ^0). 


1.2 HRV 指标 提取 


ECG 信号 是 心脏 在 每 个 心动 周期 中 ， 由 起 搏 点 、 心 房 、 心 


室 相 继 兴奋 而 产生 的 生物 电 的 变 
Variability) 是 反映 自主 神 


化 。 心 率 变 异性 〈Heart Rate 
经 系统 活性 和 定量 评估 心脏 交感 神经 


与 迷走 神经 张力 及 其 平衡 性 的 一 套 量化 指标 户 )， 其 通过 测量 连 


续 R-R 心跳 间 期 变化 的 变异 性 来 反映 心率 的 变化 过 程 及 规律 ， 


从 而 用 以 判断 其 对 全 身 器 官 的 综合 影 


HRV 指标 判断 人 体 疲 劳 ; 


复杂 导 联 体系 的 脑 电 图 仪 ， 它 可 以 通过 更 便捷 的 方式 获取 心 电 
言 号 。 早 期 的 研究 表明 ， 自 主神 经 系统 (ANS) 与 心脏 节律 之 
间 具 有 相关 性 09。 因 此 ， 可 以 用 ECG 信号 来 测量 精神 疲劳 状 
态 。 国 内 外 探索 ECG 与 疲劳 关系 的 相关 研究 主要 集中 于 视觉 
疲劳 和 运动 疲劳 两 方面 。Yang 等 人 利用 ECG 研究 观看 3D/2D 
电影 产生 的 视觉 疲劳 , 发现 SDNN 随 疲 劳 产生 而 升 高 ,NN.mean 
随 之 下 降 41。 宋 涛 等 人 研究 运动 员 在 疲劳 试验 前 后 HRV 的 变 
化 特征 ， 研 究 发 现时 域 指标 在 疲劳 试验 后 下 降 ， 而 频 域 指标 却 
显著 升 高 ,验证 了 HRV 作为 一 项 检测 运动 性 疲劳 的 可 靠 性 (19]。 


lu 


更 加 综合 的 评价 结果 。 


HRV 指标 体系 通常 分 为 时 域 和 频 域 两 种 。 时 域 指 标 是 根据 
间 期 的 统计 分 析 提 取 。 主 要 指标 包括 正常 心跳 间 期 均 


RR Hj 


天 态 ， 从 医学 理 


向 ， 包 括 脑力 活动 。 用 
论 上 说 ,可 以 得 到 一 个 


值 NN.mean; 正常 心跳 间 期 标准 差 SDNN; 短期 平均 正常 心跳 


间 期 标准 差 ， 连 续 相 邻 正常 心跳 


全 部 RR 间 期 中 相 邻 的 


NN50; NN50 除 以 正常 ， 


司 期 差 值 的 均 方 根 SDANN; 
E 常 心跳 间 期 只 差 大 于 50ms 的 心 搏 数 
心跳 间 期 总 数 乘 以 100 得 到 PNN50， 


其 计算 公式 如 表 1 所 示 。 频 域 指标 是 将 原始 ECG 时 域 信号 通 
过 傅 里 叶 变 换 转 换 到 频 域 并 计算 不 同 频段 的 谱 密 度 PSD) 得 


201807.00042v1 


chinaXiv 


录用 稿 


到 。 频 域 指标 3 
频段 功率 VLF (0.003~0.04 Hz); 1 


要 分 为 四 


个 频段 ， 总 功率 TP (0-0.4Hz2; 极 低 
氏 频 功率 LF (0.04~0.15Hz); 


高 频 功 率 HF (0.15-0.4 Hz); 低频 高 频 功率 平衡 比 LF/HF。 研 


RRK, VLF 反映 人 体 体温 的 调节 能 力 D93]、 
LF 反映 人 体 对 心脏 交感 神经 与 副 
ZDS 26. HF 主要 反映 迷走 神经 活动 的 
经 系统 的 
号 的 采样 频率 为 250 Hz。 计 算 HRV 指标 


系统 调节 
动 的 双重 调 


LF/HF 平衡 比 反 应 交感 神经 和 副交感 
本 实验 中 ECG 信 


[23: 24]. 


展 以 及 体液 


交感 神经 活 


WEHL, 


Zr 


的 时 间 窗 为 5 min， 本 文 一 共计 算 了 十 个 HRV 指标 ， 分 别 是 : 
NN.mean,、 SDNN. SDANN. PNN50.rMSSD,. TP. HF, 
LF、 VLF 以 及 LF/HF. 
表 1 HRV 时 域 指标 公式 
指标 公式 单位 
NN.mean EON) ms 
N 
SDNN sqrt emn? ms 
SDANN sqrt (Zi m) ms 
rMSSD sqrt(mean((NN;,, — NN;)?)) ms 
NN50 count(|NN;,4 — NNil)ssoms - 
PNN50 count(NNaa ^ NNiDssoms x 100% - 
N-1 
13 数据 分 析 
在 剔除 由 于 设备 不 稳定 性 以 及 特殊 情况 所 导致 的 异常 值 和 
缺失 值 后 ，29 个 被 试 的 数据 被 认为 合格 用 以 后 续 研 究 。 本 次 实 
验 全 程 持续 60-80 min. (其 中 测试 时 间 54:58 min)。 我 们 选取 测 
试 开始 前 10 min 的 ECG 数据 用 以 计算 HRV 时 域 和 频 域 指标 


作为 实验 前 的 生理 


指标 对 应 实验 前 的 Chalder 疲劳 


利用 测试 结束 前 
标 作为 实验 后 芯 


j 10 min 的 ECG 数据 得 到 HRV 时 
生理 指标 对 应 实验 后 的 Chalder 疲劳 量 表 结 果 。 


最 终 ，58 组 带 


疲劳 标签 


EL 


量 表 结 果 ， 


域 和 频 域 指 


的 样本 《测试 前 29 组 + 测试 后 


29 组 ) 


用 于 后 续 的 数据 分 析 。 
1.3.1 指标 共 线 性 分 析 
考虑 到 多 重 共 线性 对 模型 表现 的 影响 。 本 文 用 皮尔 逊 系数 

来 做 元 余 性 分 析 。 当 两 个 指标 的 相关 系数 超过 0.7 时 ， 则 认为 
这 两 个 指标 具有 多 重 共 线 性 ， 仅 保留 其 中 一 个 指标 。 如 图 1 所 
示 ，SDNN 5 rMSSD 具有 明显 的 共 线 性 关系 ; TP, LF 和 HF 
同样 也 具有 高 共 线 性 。 因此 在 后 续 建 模 中 , SONN 和 rMSSD 中 
只 能 保留 一 个 ， 同 样 TP，LF，HEF 由 于 其 共 线 性 ， 也 只 能 保留 
一 个 变量 。 

上 

Sm IN 

图 1 HRV 指标 相关 系数 图 
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1.3.2 HRV 指标 与 精神 疲劳 相关 分 析 


考虑 到 HRV 指标 通常 
检验 来 测试 疲劳 状态 和 正常 状态 下 各 个 HRV 指标 的 统计 差异 
EF 本 秩 和 检验 法 。 


性 。 曼 - 惠 特 尼 


U 检验 是 当前 


分 布 不 均 


应 用 最 / 


ZNR 


5], AK) 


其 适用 于 当 正 态 分布 、 方 差 齐 次 性 等 达 不 到 了 检验 要 求 时 ， 


为 检验 的 蔡 代 检验 方法 ， 通 过 考虑 每 个 样本 中 各 测定 值 所 排 
的 秩 , 以 检验 两 个 总 体 的 均值 是 
验 的 P 值 , 可 以 作为 考察 HRV 各 项 指标 的 显著 性 的 参考 


图 2 展示 了 HRV 指标 在 疲劳 与 正常 状态 


图 2 可 以 看 出 ， 


的 箱 线 图 。 


PNN50 是 在 疲劳 状态 


显著 低 于 正常 状态 


J=- -E 特 尼 U 


作 


否 有 显著 差异 。 曼 - 惠 特 尼 U 检 
依据 。 


NN.mean 也 是 个 同样 显著 的 指标 ， 在 疲劳 状态 下 会 明显 下 
BE. rMSSD. TP. VLF 和 LF 指标 在 疲劳 状态 下 ， 与 正常 状态 
相 比 会 有 微小 上 升 。 
i 二 | 4 早早 | jq iu a x 
dm) eum ene EHE 
图 2 HRV 指标 在 疲劳 和 正常 状态 下 的 箱 线 图 
表 2 展示 了 曼 - 惠 特 尼 U 检验 结果 ,在 0.1 的 显著 水 平 下 ， 


PNN50 指标 下 , 疲劳 状态 和 正常 
NN.mean,LF 和 VLF 接近 显著 (pmean= 0.112, prr= 0.166, pvrr= 
而 其 他 指标 诸如 SDNN、TP、HF、LF/HF 均 未 通过 曼 
- 惠 特 尼 U 检验 。 但 是 曼 - 惠 特 尼 U 检验 仅仅 从 均值 角度 检测 是 


0.109) 。 


状态 存在 显著 差异 (p=0.02 )， 


否 存在 显著 性 差异 ， 而 并 未 对 于 HRV 指标 与 疲劳 之 间 的 关系 


进行 探究 


X2 曼 - 惠 特 尼 U 检验 结果 


HRV 指标 原 假设 HO P 值 
NN.mean X(fatigue = 0}= X {fatigue = 1} 0.112 
SDNN X {fatigue = 0}= X {fatigue = 1} 0.597 
PNN50 X {fatigue = 0}= X {fatigue = 1} 0.020 (**) 
TP X {fatigue = 0}= X {fatigue = 1} 0.225 
LF X {fatigue = 0}= X {fatigue = 1} 0.166 
HF X {fatigue = 0}= X {fatigue = 1} 0.335 
VLF X {fatigue = 0}= X {fatigue = 1} 0.109 
LF/HF X {fatigue = 0}= X {fatigue = 1} 0.312 
1.3.3 基于 随机 森林 的 HRV 指标 评价 
随机 森林 分 类 器 是 一 种 基于 随机 抽取 的 样本 信息 ， 通 过 建 
江 多 个 独立 决策 树 模 型 分 别针 对 预测 目标 建立 分 类 模型 ， 并 通 
过 综合 所 有 决策 树 独立 预测 结果 ， 基 于 投票 方式 决定 待 分 类 变 
量 的 类 别 。 假设 一 共生 成 K 颗 决 策 树 ,样本 的 特征 数 为 M， 依 
据 bootstrap 抽样 提取 子 训练 集 , 再 从 全 部 特征 中 随机 抽取 制定 
数目 的 特征 建立 多 个 决策 树 分 类 器 {h(x,0i),i = 1,2,3...K}， 其 


中 {0} 是 独立 同 分 布 的 随机 向 量 。 
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每 一 颗 决 策 树 的 生长 依赖 于 一 个 独立 同 分 布 的 随机 向 量 ; 
其 整体 的 泛 化 误差 则 取决 于 随机 森林 中 单 颗 决 策 树 的 分 类 能 
以 及 各 分 类 树 的 相关 程度 。 随 机 森林 除了 作为 一 种 分 类 器 以 外 ， 
同时 也 可 以 用 于 特征 选择 ， 基 于 随机 森林 的 特征 评价 主要 有 两 
种 形式 : 

1) 基 于 Gini 指数 的 变化 程度 

分 类 树 在 剪 枝 过 程 中 通常 通过 基于 节点 纯度 最 大 原则 判断 
是 否 进行 分 裂 操 作 。 节 点 纯度 通常 根据 Gini 指数 来 度量 : 


Gini(D) = Y^ E, Ls Pio, 


(1) 

Gini 指数 越 小 ， 则 纯度 越 高 ， 依 据 Gini 指数 CX (1)) 的 
变化 ， 可 以 反映 每 个 特征 的 重要 性 ， 其 值 越 小 ， 纯 度 越 高 ， 说 
明 特 征 越 重 要 P8: 29], 

2) 基 于 分 类 准确 度 下 降 的 程度 

袋 外 误差 (out-of-bag error, OOB ) 通 常用 来 衡量 分 类 精度 ， 
其 同样 可 以 用 来 衡量 特征 重要 性 。 在 得 到 每 一 颗 决 策 树 的 OOB 
误差 (B0)， 对 于 每 一 个 参与 决策 树 运算 的 特征 变量 ， 保 持 其 他 
特征 取 值 不 变 ， 将 指定 特征 袋 外 数据 取 值 随机 打 断 ， 重 新 计算 
决策 树 袋 外 误差 (Bt)， 所 有 决策 树 两 类 袋 外 误差 的 差 值 的 均值 
即 为 该 特征 的 重要 性 评分 VIM， 对 于 特征 M, 重要 性 评分 公式 
为 


1 
VIM(M) = x Xii (Git — Bj) Q) 
重要 性 评分 VIM 越 大 则 特征 重要 性 越 高 B31。 


从 图 中 可 以 看 出 ,在 基于 分 类 准确 度 下 降 的 程度 的 评价 体系 中 ， 
最 为 重要 的 五 个 指标 分 别 是 VLF、LF、TP、NN.mean、PNN50， 
重要 程度 依次 递减 , 而 基于 Gini 指数 的 变化 程度 的 评价 体系 中 
最 为 重要 的 五 个 指标 分 别 为 NN.mean、PNN50、rMSSD、VLF、 
LF， 重 要 程度 依次 递减 ， 结 合 曼 - 惠 特 尼 U 检验 以 及 随机 森林 
的 检验 结果 ， 本 文 将 NN.mean、PNN50、TP、LF、VLF 列 为 重 
要 指标 ， 作 为 后 面 分 类 模型 的 验算 指标 组 合集 合 。 


VLF 9|  NNmean | 
LF o pnn50 | 
TP è MSSD > | 
NN.mean E VLF | 
pnn50 o LF | 
MSSD 9 SDNN | 
SDNN TP | 
HF HF | 
LF .HF LF HF | 
T—T FT T 
22310122345 0 4 


1 2 3 
MeanDecreaseAccuracy MeanDecreaseGini 


图 3 基于 随机 森林 的 HRV 指标 的 重要 性 评价 
1.4 “分 类 器 算法 理论 与 性 能 比较 
1.4.1 分 类 器 算法 理论 
1) 支 持 向 量 机 SVM 分 类 算法 
SVM 分 类 器 学 习 思 想 是 基于 训练 集 D 在 样本 空间 中 找到 
一 个 划分 超 平面 ， 将 不 同类 别 的 样本 分 开 ， 超 平面 可 以 用 如 下 
线性 方程 表示 : 


图 3 展示 了 基于 两 种 随机 森林 指标 评价 的 重要 性 得 分 结果 。 
H 
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wix+b=0 (3) 
胡 (w,b) 能 将 样本 正确 分 类 ， 则 对 于 v(xi,y;) ED 


假设 超 平 


有 
yi(wTxi +b) 2 1,i = 1,2 ...,m 
4) 
距离 超 平面 最 近 的 几 个 训练 样本 点 使 得 等 式 (4) 成 立 ， 被 称 
为 支持 向 量 (support vector)， 两 个 异类 支持 向 量 到 达 超 平面 的 
距离 之 和 为 


2 


ys (5) 
欲 找 到 具有 最 大 隅 间 (maximum margin) 的 划分 超 平面 ， 即 

最 大 化 ||wll-! 等 价 于 最 小 化 ||lwll?， 求 解 优化 方程 : 
minzllwl (6) 


s.t. yi(w*x; + b) 2 1,i = 12,..,m 

2) 朴素 贝 叶 斯 分 类 器 (naïve Bayes) 

朴素 贝 叶 斯 的 分 类 思想 是 在 贝 叶 斯 概率 框架 下 ， 在 所 有 相 
关 概 率 已 知情 况 下 ， 基 于 这 些 概 率 和 误 判 损失 来 选择 最 优 的 类 
别 标 记 。 其 判断 准则 是 基于 后 验 概率 P(c|x) 及 误 判 损失 ， 以 最 
小 化 条 件 风险 为 原则 的 最 优 分 类 器 .朴素 贝 叶 斯 分 类 器 基于 “ 属 
性 条 件 独立 性 假设 ” 对 已 知 类 别 , 假设 所 有 属性 相互 独立 ， 则 
基于 该 假设 ， 样 本 x 相对 于 类 标记 c 的 类 条 件 概 率 P(c|x) 表 示 
为 


P(c)P(x|c)) _ P(c) 
P(c|lx) = BE soo lle P Galo) (7) 


其 中 : d 表示 特征 类 别 ，xi 表 示 x 在 第 i 个 属性 上 的 取 值 。 由 于 
对 于 所 有 特征 类 别 来 说 P(x) 相 同 ， 因 此 最 小 化 分 类 错误 率 的 村 
素 贝 叶 斯 最 优 分 类 器 为 


hns (x) = argmax P(c) [15i P (Xic) (8) 
cey 


朴素 贝 叶 斯 分 类 器 的 训练 过 程 就 是 基于 训练 集 忆 估计 类 先 
验 概率 P(c), 并 根据 式 (8) 为 每 个 特征 估计 条 件 概 率 P(xilc)， 再 
根据 式 (7) 得 到 样本 x 相对 于 类 标记 e 的 类 条 件 概率 P(c|x)， ; 
样本 划分 到 类 条 件 概率 最 大 的 类 别 。 


e 


3) K 近邻 分 类 器 KNN 


K 近邻 (K-nearest neighbor, KNN) 分 类 器 , 给 定 测试 样本 ， 
于 距离 度量 函数 找 出 训练 集中 与 其 靠近 的 大 个 训练 样本 ， 通 
常 通过 “投票 法 ”， 即 选择 这 个 样本 中 出 现 最 多 的 类 别 标记 作 
为 预测 结果 。 给 定 样本 x， 若 其 最 近邻 样本 为 z， 则 最 近邻 分 类 
器 出 错 概率 ， 即 x 与 z 类别 标记 不 同 的 概率 可 以 表示 : 


Bu 


P(err) = 1 — Xe P(c|x)P(e|z) (9) 


4) 逻辑 回归 Clogistics regression) 


逻辑 回归 是 一 种 针对 二 分 类 变量 的 广义 的 线性 回归 ， 在 线 
性 回归 模型 的 基础 上 引入 对 数 几率 函数 使 得 因 变 量 y 尽 可 能 吉 
近 0 或 1， 本 质 在 形式 上 仍然 保留 线性 回归 的 特征 ， 实 际 上 求 
取 输 入 空间 到 输出 空间 的 非 线性 函数 映射 ， 逻 辑 回 归 模 型 表达 
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式 如 式 (10) 所 示 。 PNN50 65.6% 
In 2 — w'x- b (10) NN.mean-PNN50 64.3% 
若 将 式 (10) 中 的 y 视 为 后 验 概率 p(y = 1|x)， 则 式 (10) 可 以 NN.mean+PNN50+TP 54.7% 
a 表 5 KK 近邻 模型 表现 
PEO 指标 组 合 KNN 交叉 验证 准确 度 
(11) NN.mean+TP 73.5% (k=3) 
p(y = 0|x) +p(y = 1|x) = 1 得 到 : PNN50+TP 69.796 (k=4) 
ewT+b NN.mean+PNN50 68.7% (k=9) 
pO = 1|x) = 了 
NN.mean+TP+LF 75.5% (k=3) 
(12) NN.mean+TP+VLF 73.5% (k=3) 
p(y = 0|x) = (13) 表 6 人 逻辑 回归 模型 表现 
对 逻辑 回归 模型 求 最 大 似 然 函 数 ， 可 以 估计 出 w，2: 指标 组 合 Logistic Regression 交叉 验证 准确 度 
l(w, b) = Xiz4 In pCyilxi w, b) (14) PNN50 65.6% 
1.4.2 分 类 器 性 能 比较 
. " : . a NN.mean 66.1% 
= 本 文 一 共 对 比 了 四 种 机 器 学 习 分 类 算法 : 支持 向 量 机 
(SVM )， 朴 素 贝 叶 斯 分 类 器 (Naïve Bayes), KNN PLA $8 [n NN.mean*PNN50 62.5% 
| 
hw p 3H o 并 通过 网 格 搜索 寻找 最 优 参 数 ， 分 类 器 的 D E 能 通过 交叉 验 NN.mean- PNN50--VLF 63.1% 
C 证 进行 检验 , 最 终 分 类 器 的 性 能 评估 有 交叉 验证 准确 度 和 AUC 
< NN.mean+PNN50+LF+TP 68.3% 
O "e. 
N 表 3-6 展示 了 四 种 分 类 模型 下 ,考虑 不 同 数量 的 指标 组 合 ， NN.mean+PNNSO+TP+LF+VLE 69.9% 
Se AS 性 能 。 g£ H H 
A 最 优 的 分 类 器 性 能 。 从 结果 来 看 , KNN 算法 的 表现 明显 优 于 其 表 7 由 种 分 类 算法 的 AUC ff 
ZA 2I ET 3: ^ TA RZ pan 
v ”他 三 种 分 类 算法 ,在 NN mean. TP 和 LF 三 个 HRV 指标 组 合 分 类 算法 mm —- E xu 
e ,交叉 验证 准 3d | .5%(K=3). 类 Wa 
ed F, 交叉 验证 准确 率 达 到 75.599 (K-3). SVM 分 类 器 仅 次 于 KNN pes ua Y nem me 
算法， 其 最 优 分 类 器 下 ， 交 又 验证 准确 率 达 到 71.696 (HRV 指 
之 ” 标 组 合 为 NN.mean 、PNN50)。 朴 素 贝 叶 斯 模型 和 逻辑 回归 模 
PX 型 表现 咯 次 ， 交 叉 验证 算法 的 准确 率 分 别 为 65.6% 和 69.996. 
外。 下 7 和 图 4 分 别 给 出 了 四 种 算法 的 AUC 值 和 ROC 曲线 ， 从 结 
um 
rz 果 可 以 看 出 ，KNN 的 AUC 值 最 高 ， 达 到 0.74，SVM 的 AUC 
(G 值 为 0.68，NB 以 及 LR 的 AUC 值 相对 较 低 ， 仅 达到 0.64 和 


0.65。 从 整体 上 我 们 可 以 得 到 结论 ，KNN 分 类 器 在 应 用 于 脑力 
劳动 者 精神 疲劳 分 类 中 ， 具 有 显著 有 效 的 效果 ， 而 根据 最 优 分 
类 器 选取 的 指标 结果 来 看 ， 用 于 检测 脑力 劳动 者 精神 疲劳 状态 
的 最 有 效 的 指标 为 PNN50, NN.mean, LF, VLF 以 及 HF, 这 四 
个 指标 无 论 是 在 之 前 的 随机 森林 评价 得 分 还 是 在 最 优 分 类 器 指 
标 选择 的 结果 上 看 ， 都 是 最 有 效 的 。 

表 3 支持 向 量 机 模型 表现 


指标 组 合 SVM 交叉 验证 准确 度 
NN.mean 59.196 
PNN50 63.496 
NN.mean*PNN50 71.6% 
NN.mean+PNN50+TP 64.1% 
NN.meantPNN50+LF+VLF 64.1% 

表 4 朴素 贝 叶 斯 模型 表现 
指标 组 合 Naive Bayes 交叉 验证 准确 度 
NN.mean 60.096 


84 四 种 分 类 


f 法 的 ROC 曲线 
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本 文 基于 HRV 分 析 , 通过 便携 式 心 电 仪 设备 , 为 脑力 工作 
者 精神 疲劳 检测 提供 了 一 种 可 行 性 工程 方案 。 本 研究 在 模拟 脑 
力 工 作 场 景 下 ， 通 过 结合 问卷 量 表 和 “ 肯 朗 心 ” 便 携 式 心 电 仪 
采集 的 心 电 数据 进行 疲劳 状态 的 数据 统计 分 析 与 疲劳 状态 识别 。 
本 文 主要 解决 了 两 个 问题 : 精神 疲劳 状态 与 哪些 HRV 指标 相 
As 如 何 基于 HRV 指标 体系 建立 疲劳 状态 识别 模型 。 针 对 第 一 
个 问题 ， 本 文通 过 曼 - 惠 特 尼 U 检验 ， 得 到 PNN50 指标 是 显著 
有 效 的 ，NN.mean、LF 和 VLF 接近 显著 。 通 过 随机 森林 分 类 
器 ， 分 别 基 于 Gini 指数 和 分 类 准确 度 两 种 角度 ， 对 HRV 指标 
进行 重要 性 评估 ， 基 于 分 类 准确 度 角 度 ， 最 为 重要 的 五 个 指标 
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分 别 是 VLF、LF、 TP. PNN50， 而 基于 Gini 指 


NN.mean、 


数 角 度 , 最 为 重要 的 五 个 指标 分 别 为 NN.mean, PNN50, rMSSD, 


VLF, LF, 结合 曼 - 惠 特 尼 U 检验 以 及 随机 森林 的 检验 结果 , 本 
文 将 NN.mean、PNN50、TP、LF、VLE 判断 为 精神 疲劳 程度 的 
重要 指标 。 针 对 第 二 个 问题 ， 本 文 分 别 对 四 种 机 器 学 习 分 类 器 
性 能 进行 评估 ， 研 究 结果 显示 ，KNN 算法 的 表现 最 佳 ， 在 
NN.mean、TP 和 LF 三 个 HRV 指标 组 合 下 ， 交 叉 验 证 准确 率 
达到 75.5%(K=3)。KNN 的 AUC 值 最 高 ， 达 到 0.74。 从 整体 上 
我 们 可 以 得 到 结论 , KNN 分 类 器 在 应 用 于 脑力 劳动 者 精神 疲劳 
分 类 中 ， 具 有 显著 有 效 的 效果 。 
过 度 疲 劳 对 人 体 身 心 造成 巨大 伤害 并 影响 人 体 的 正常 思维 
和 工作 ， 研 究 疲 劳 状 态 识别 具有 重大 的 现实 意义 。 基 于 便携 式 
心 电 仪 识别 人 体 疲劳 状态 ， 本 文 提出 了 一 个 具有 工程 可 行 性 
解决 方案 本文 对 心 电 信号 与 精神 疲劳 的 关系 进行 了 探索 分 析 ， 
对 未 来 进一步 研究 精神 疲劳 ， 有 效 的 识别 、 预 测 和 干预 人 体 
力 负荷 等 问题 做 下 了 研究 铺垫 。 
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